AI资讯新闻榜单内容搜索-DeepMind

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: DeepMind
ACL 2025|自我怀疑还是自我纠正?清华团队揭示LLMs反思技术的暗面

ACL 2025|自我怀疑还是自我纠正?清华团队揭示LLMs反思技术的暗面

ACL 2025|自我怀疑还是自我纠正?清华团队揭示LLMs反思技术的暗面

反思技术因其简单性和有效性受到了广泛的研究和应用,具体表现为在大语言模型遇到障碍或困难时,提示其“再想一下”,可以显著提升性能 [1]。然而,2024 年谷歌 DeepMind 的研究人员在一项研究中指出,大模型其实分不清对与错,如果不是仅仅提示模型反思那些它回答错误的问题,这样的提示策略反而可能让模型更倾向于把回答正确的答案改错 [2]。

来自主题: AI技术研报
6254 点击    2025-07-14 15:40
突发!OpenAI 30 亿美元收购案黄了,AI 编程明星公司被谷歌截胡

突发!OpenAI 30 亿美元收购案黄了,AI 编程明星公司被谷歌截胡

突发!OpenAI 30 亿美元收购案黄了,AI 编程明星公司被谷歌截胡

曾被 OpenAI 相中,开价 30 亿美元的 AI 编程初创公司 Windsurf,如今转身投奔了 Google。就在刚刚,Google 宣布将 Windsurf 部分高管及工程团队纳入其旗下的 DeepMind 团队,重点推进「代理式编码」(Agentic Coding)方向的研究。

来自主题: AI资讯
7530 点击    2025-07-12 09:53
打破大模型编程「数据污染」与「能力虚胖」困境,Meituan-M17团队构建新一代AI编程评测新标准——OIBench

打破大模型编程「数据污染」与「能力虚胖」困境,Meituan-M17团队构建新一代AI编程评测新标准——OIBench

打破大模型编程「数据污染」与「能力虚胖」困境,Meituan-M17团队构建新一代AI编程评测新标准——OIBench

当前,大语言模型(LLMs)在编程领域的能力受到广泛关注,相关论断在市场中普遍存在,例如 DeepMind 的 AlphaCode 曾宣称达到人类竞技编程选手的水平

来自主题: AI技术研报
8243 点击    2025-07-11 17:05
刚刚,首个能在机器人上本地运行的具身Gemini来了

刚刚,首个能在机器人上本地运行的具身Gemini来了

刚刚,首个能在机器人上本地运行的具身Gemini来了

今天,Gemini 家族迎来了一个新成员:Gemini Robotics On-Device。这是谷歌 DeepMind 首个可以直接部署在机器人上的视觉-语言-动作(VLA)模型,可以帮助机器人更快、更高效地适应新任务和环境,同时无需持续的互联网连接。

来自主题: AI资讯
7771 点击    2025-06-25 09:02
我们是否需要重新定义与AI的边界?

我们是否需要重新定义与AI的边界?

我们是否需要重新定义与AI的边界?

AI会有情感吗?机器人会不会感知到疼痛?未来人类与AI的边界在哪里?我们梳理了"互联网女皇"玛丽·米克尔、"AI教父"杰弗里·辛顿、科技预言家凯文·凯利、DeepMind CEO德米斯·哈萨比斯的近期访谈,他们从诸多维度,各自表达他们心中的AI时代图景。

来自主题: AI资讯
6035 点击    2025-06-09 11:08
AI摧毁就业?DeepMind CEO:这是一场比互联网更猛的职业洗牌

AI摧毁就业?DeepMind CEO:这是一场比互联网更猛的职业洗牌

AI摧毁就业?DeepMind CEO:这是一场比互联网更猛的职业洗牌

从国际象棋神童到诺贝尔奖得主,Hassabis正带领谷歌DeepMind追逐AGI梦想。AI正在颠覆职场,但Hassabis乐观地认为,AI不仅能提高生产力,创造新工作,还可能让人类不再自私!

来自主题: AI资讯
6519 点击    2025-06-06 12:14
2030年前必须实现AGI!谷歌祖师爷现场「催更」DeepMind CEO

2030年前必须实现AGI!谷歌祖师爷现场「催更」DeepMind CEO

2030年前必须实现AGI!谷歌祖师爷现场「催更」DeepMind CEO

在谷歌I/O大会后,创始人谢尔盖·布林惊喜现身,与Hassabis深入探讨AI的推理能力、规模与算法、测试时计算及多模态智能体的应用前景。布林强调AI时代是计算科学家不应退休的黄金期,AI影响将远超互联网与手机。

来自主题: AI资讯
4910 点击    2025-05-23 11:50
Veo 3全网实测惊艳所有人!DeepMind CTO:规模是AGI全部吗?

Veo 3全网实测惊艳所有人!DeepMind CTO:规模是AGI全部吗?

Veo 3全网实测惊艳所有人!DeepMind CTO:规模是AGI全部吗?

Veo 3实测来袭:从会说话的松饼到电影质感的短片,一句提示词就能打造电影质感短片,还能音画同步,好莱坞真的要慌了?DeepMind首席技术官更在访谈中透露,Deep Think模式像多线程大脑般并行推理,而AGI的竞赛早已超越单纯「堆算力」。

来自主题: AI资讯
4895 点击    2025-05-21 16:55
刚刚,Gemini 2.5 Pro升级,成编程模型新王

刚刚,Gemini 2.5 Pro升级,成编程模型新王

刚刚,Gemini 2.5 Pro升级,成编程模型新王

你的默认编程模型是什么?或许可以换一换了。刚刚,Google DeepMind 发布了 Gemini 2.5 Pro 的最新更新版本:Gemini 2.5 Pro (I/O edition)。其最大的进步是编程能力大幅提升,不仅在 LMArena 编程排行榜上名列第一,同时也在 WebDev Arena 排行榜上更是以显著优势超过了昔日霸

来自主题: AI资讯
9142 点击    2025-05-07 09:22